議程簡介
Apache Spark 出身在 UC Berkely AMPLab 實驗室,他是目前 Big Data 界最受歡迎的 Big Data Platform 。
Apache Spark 最強大的地方是在於運算速度跟使用的簡易性。在許多資料學習的使用案例上,他的 RDD cache 機制,比 Hadoop MapReduce 快 10 ~ 100 倍的時間,他支援的 DAG Engine 讓他可以輕易的寫出更多可能性的 Big Data 程式,並且,Apache Spark 擁有彈性的 API,讓程式設計師可以直接使用 Python, Java , Scala 等熟悉的語言來寫 Big Data 程式。
目前 Apache Spark 已經被 Yahoo, Twitter, IBM, 掏寶,百度,騰訊等大公司使用,是一個前景相當看好的 Framework。
本課程將介紹 Spark 的原理、使用方式以及基本 Big Data 程式開發。
講者簡介
陳凱翔(thegiive)
Wisely Chen 是 Yahoo 資深工程師。他目前在 Yahoo 研究 Big Data/軟體工程/Continuous Integration 和 Continuous Delivery 等 topic。
他是一個技術分享的傳教士,之前曾經在許多國外 Conference 分享過許多相關的技術,像是 Hadoop Summit 2013、Spark Summit 2014、Jenkins Conference 2013,他同時也在 Coscup、OSDC、WebConf、PHPConf、RubyConf 等國內 Conference 有分享過許許多多不同 topic。